音乐在各种文化的历史中普遍占有一席之地。更令人称奇的是,各种音乐体系和风格都共享一些特征,如将声音频率切分为一组离散的音高,中国传统五声音阶(宫商角徵羽)就是典型的例子。由此产生了一个问题:为什么人们要用这种组织声音的方式来创造音乐呢? 要回答这一问题,首先要了解音乐何以为音乐。从历史上看,音乐理论一直遵循自上而下的经验主义方法,将音乐中观察到的模式概括为理论。直到20世纪,Helmholtz 创立的心理声学(psychoacoustics)定量研究了声音感知,才首次提供了自下而上的音乐理论。该理论称音乐的结构与最小化不和谐音 D(dissonance)有关。然而,仅仅最小化不和谐音 D 不足以有效组织音乐系统,否则我们就都会去听仅由单一音高组成的“音乐”了。由此可知,有效的音乐系统必须具有一定程度的复杂性,为谱曲提供丰富的“色彩”。 最小化不和谐音将音乐系统推向有序,保证一定复杂性将音乐系统推向无序,悦耳的音乐涌现于无序和有序竞争的张力中。Jesse Berezovsky 就基于这两个原则,量化了不和谐音 D 和音乐复杂性 S ,并将其数学描述直接映射到一个标准的统计力学框架,运用统计力学的工具探索声音中涌现出的音乐结构。
2. 统计力学工具研究音乐模式
热力学系统的宏观状态决定于自由能 F = U-TS 的最小化,这需要平衡最小化能量 U 和最大化熵 S ,温度 T 则作为两者的调节参数。Berezovsky 提出的模型类比热力学系统,引入参数 T ,调节最小化不和谐音 D 和最大化复杂性 S 间的平衡,以此利用统计力学中研究物理系统相变的强力工具。其中,不和谐音 D 由音乐系统中各音调两两相互作用形成的不和谐程度相加而得,而两音调的不和谐程度可通过实验获得。复杂性则可以通过声音熵 S (与声调的数量相关)量化。 Berezovsky 首先应用平均场近似(mean field approximation)研究音乐系统中音高的均衡分布。考虑音调数量趋于无穷,此时音高被描述为概率分布P(x),其中 x=log2f/fref(以此对数尺度衡量音高,则x=1对应音高变化八度)。图1 展示了不同 T 值时,最小化音乐系统自由能 F = D-TS 的音高概率分布解 P(x)。
图1. 不同 T 值时,平均场近似下的音高概率分布解 P(x)。T由高降低,模型在T=20.2时首次出现有序解。
热力学系统中,能量相互作用在低温下占主导地位,有序出现;温度升高则熵增,导致有序到无序的转变。通过改变参数 T ,Berezovsky 发现了音乐系统也出现了类似的音高转变。在高 T 时,声音熵占主导地位,所有音高出现的概率相同,系统完全无序(图1顶行)。在低 T 时,最小化不和谐音占主导,音乐系统仅出现一个音高(图1最下面一行)。当 T 由高降低时,西方音乐八度十二音的熟悉结构从无序中涌现而出,这一转变可通过朗道理论理解。 在平均场模型中观察到音乐结构的涌现后,Berezovsky 又转向数值模拟,研究假设放宽下的结果。具体而言,平均场模型中各音调相互作用一致,而数值模拟可通过将音调放置在格点(lattice)上,研究每个音调仅与其余音调的子集相互作用的情况,同样发现了熟悉的音乐结构涌现于模型中。